查看原文
其他

使用 Word2Vec 和 TF-IDF 计算五类企业文化

大邓 大邓和他的Python
2024-09-09



Kai Li, Feng Mai, Rui Shen, Xinyan Yan, Measuring Corporate Culture Using Machine Learning, The Review of Financial Studies, 2020

摘要: 我们使用最新的机器学习技术——词嵌入模型——和209,480份盈利电话会议记录创建了一本文化词典。我们对2001年至2018年期间的62,664个公司年度观察数据的五个公司文化价值——创新、诚信、质量、尊重和团队合作进行评分。结果表明,创新文化比公司创新的通常衡量标准——研发支出和专利数量——更广泛。此外,我们还表明,企业文化与业务结果相关,包括运营效率、风险承担、盈利管理、高管薪酬设计、企业价值和交易等,并且文化-绩效联系在困难时期更加显著。最后,我们提供了初步证据,表明企业文化受到重大公司事件(如合并和收购)的影响。


内容概况

今天分享的内容主要包括两部分, 即

  • 使用 word2vec 扩展得到五大类企业文化词典
  • 使用 TF-IDF 算法,结合五类文化词典对公司进行评分

算法步骤

  1. 构建种子词;人工构建五类企业文化的种子词典, 每类词典人工准备5-10个词
  2. word2vec扩充;使用word2vec扩充五类企业文化词典的词汇量
  3. TF-IDF;将文本数据转为tf-idf格式

  4. 计算五类企业文化得分;筛选含有文化词的列,按不同企业文化类别,分别求和得到得分。



修改于
继续滑动看下一个
大邓和他的Python
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存